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Машинное понимание текстов естественного 
языка. онтологическая Парадигма 


Выполнен сравнительный анализ двух принципиально разных подходов к семантической обработке 
текстов и дискурсов: логическая интерпретация и онтологический анализ. В зависимости от семантической 
сложности текста устанавливается сфера применимости каждого направления. Подробно рассматривается 
метод онтологического анализа, который опирается на систему знаний и формализованную категорию 
«смысл». Уточняется понятие «машинное понимание текстов ЕЯ». 


Введение 


В настоящее время ощущается необходимость определиться с двумя подхо- 
дами к семантическому анализу естественно-языковых текстов. В первом из них успеш- 
но применяются логические методы представления и обработки и интерпретации 
текстовых знаний в узких предметных областях (ПрО), которые реализованы во 
многих поисковых и диалоговых системах. Несколько иной, логико-лингвистический 
подход, который сформулирован в виде модели «Смысл — Текст» [1], предполагает 
выделение в тексте определённых семантических структур, которые, со своей сторо- 
ны, тесно связаны с морфологическими и семантическими подструктурами. Модель 
знаний в лингвистической модели явно не задана, она не структурирована и не огра- 
ничена рамками ПрО, а результат семантического анализа текста не сформулирован. 

В отличие от этих направлений для содержательного анализа текстов со слож- 
ной семантикой или «гибкой структурой» (например, художественных произведе- 
ний) требуются принципиально иные методы семантической обработки, которые 
рассматриваются ниже. Они основаны на использовании контекстного знания. Логи- 
ческая интерпретация и содержательный анализ текстов естественного языка (ЕЯ) не 
могут быть противопоставлены друг другу: каждый соотносится со своей областью 
применения. Если логическая обработка, в принципе, устанавливает непротиворе- 
чивость высказываний «логическим знаниям» о предметной области и их выводи- 
мость из системы аксиом, то в задаче семантического анализа слабоформализованных 
и разнообразных по тематике текстов ЕЯ на первый план выдвигается понимание 
авторского (коммуникативного) замысла, извлечение его из текстового материала и 
лексическое оформление. 

С позиций искусственного интеллекта Д.А. Поспелов выделил пять уровней 
машинного понимания текстов различной степени семантической сложности. На пер- 
вом и втором уровне востребуются только те термины, которые содержатся в тексте 
непосредственно или могут быть получены из текста путём его логического расши- 
рения. На третьем уровне для понимания текста нужно привлечь некоторую допол- 
нительную информацию, которую нельзя вывести логическими методами. Четвёр- 
тый и пятый уровни требуют, чтобы к интерпретации текста были привлечены такие 
понятия, которые в тексте отсутствуют, но накоплены в базах знаний о мире, 
социуме и используются в предметных областях человеческой деятельности. 
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В последних двух вариантах толкование текста требует привлечения широкого 
контекстного материала: знаний о целях коммуникации, о социальной среде, её 
моральных и культурных ценностях и других системных характеристик. 

Цель и содержание данной работы состоят в том, чтобы проанализировать и 
сравнить между собой два различных подхода к семантической обработке текстов — 
логическую интерпретацию и контекстный анализ - и на основании сравнения обо- 
сновать онтологический метод семантического анализа, который опирается на 
триаду «Текст — Знания — Смысл». В итоге формализуются категории «онтологи- 
ческий смысл» и «машинное понимание текстов ЕЯ». 


Текст и дискурс 


Объектом семантического разбора является текст или дискурс. Необходимо 
обозначить рамки этих понятий следующими вопросами: Что такое текст? Каково 
его функциональное назначение? Что мы хотим из него извлечь? Последний вопрос 
является кардинальным для определения задачи машинного понимания текста. 

Для выяснения этих вопросов дадим следующее определение. Текст есть лексиче- 
ская, грамматически и тематически оформленная, конечная форма передачи замысла 
автора партнёру по коммуникации — в общей знаковой, языковой и знаниевой среде. 

Современная теоретическая лингвистика опирается на семь критериев текста, 
сформулированных в 1981 г. Бограндом и Дресслером: 1) связность, 2) целостность, 
3) интенциональность, 4) приемлемость, 5) информативность, 6) ситуационность и 7) ин- 
тертекстуальность [2]. В русле данной работы нас будут интересовать следующие 
параметры текста: связность, целостность (тематическое единство) и интенциональ- 
ность (авторский замысел). 

В данном исследовании никаких ограничений на тематическое содержание тек- 
стов не накладывается. Большинство исследователей считают функциональным на- 
значением текста фиксацию и передачу рациональных и культурных знаний в 
процессе коммуникации людей и сообществ. Текст рассматривают как вербализо- 
ванную и закодированную средствами языка мысль автора (или его замысел). 

На практике сложилось нечёткое разделение текстов на два вида: те, которые 
функционируют в узкой специализированной предметной области (ПрО) или в доку- 
ментообороте, и другие, неформатные тексты с широким спектром семантических 
отношений, например — дискурсы и художественные произведения. Первый вид харак- 
теризуется неболыпим количеством семантических отношений и достаточно высокой 
структурируемостью данных. Наоборот, дискурс определяется как «связный текст в 
контексте многих конституирующих и фоновых факторов — социокультурных, психо- 
логических и т.д.» [3]. Он характерен локальными (микро) и глобальными (макро) се- 
мантическими структурами, причём последние реализуются сложными, нелинейными 
схемами их смыслового взаимодействия, которые управляются авторским замыслом. 

Существо дискурса, его суть определяются не столько количеством включён- 
ных в ситуацию объектов, сколько переплетением связей между ними. Связи эти 
имеют преимущественно ассоциативный характер. Именно в многообразии непред- 
сказуемых отношений между семантически оформленными элементами заключена 
сложность текста для его восприятия. 

Под сложным текстом мы будем понимать такой, который нельзя представить 
конечным числом предикативных отношений в силу существования сюжетных, корефе- 
рентных и имплицитных связей между отдалёнными частями (смысловыми блоками) 
текста. Именно референциональные связи «отражают коммуникативную установку 
автора, его интенции, фонд знаний партнёра, коммуникативную организацию высказы- 
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вания, отношение к контексту» [3]. Эти связи многообразны и трудноперечислимы, не 
всегда могут быть установлены логическими рассуждениями, а их совокупность сов- 
местно с объектами воссоздаёт фрагмент реальной (или ментальной) действительности. 

Отсюда вытекают трудности принципиального характера, когда мы хотим из- 
влечь из текста его главное содержание, то есть — выявить ту коммуникативную 
цель, которую преследует автор. Предполагая, что эта цель выражена в тексте неко- 
торым «смыслом», и что вербализованный смысл отделён от автора, мы тем самым 
признаём объективность данной категории. «Смысл существует сам по себе как 
инвариант, который выясняется (устанавливается) во время перевода или пересказа 
текста» [3]. Более того, чётко утверждается, что «сам текст на естественном языке 
является лишь проводником смысла, а замысел и знания автора лежат во вто- 
ричной структуре (смысловой структуре или макроструктуре текста}»[4]. 

Самым серьёзным фактором, которому в лингвистике уделено недостаточно 
внимания, является тот, что текст — как закодированная в языке мысль — «погружён» 
в систему человеческих знаний о мире, которая опосредовано образует «интеллекту- 
альный фон» и самой мысли, и контекст её изложения. 


Логика 


Отношение логики к смыслу и смысла к логике 


Будем исходить из предпосылки, что в классической логике значение истин- 
ности любого сложного высказывания, которое построено из простых (аксиома- 
тических) высказываний и логических связок и, или, не, есть функция истинности 
простых высказываний, причём аргументы и функции заданы на множестве зна- 
чений (истина, ложь). Центральной проблемой теории является проверка выво- 
димости утверждений и их логической непротиворечивости. Хотя сами по себе 
логические высказывания инвариантны к содержательной (смысловой) стороне тер- 
минов, предполагается, что от бессмысленных высказываний должны уберегать 
«правильные» аксиомы, поскольку на стадии их формирования закладывается семан- 
тическая связь с внешним миром. Кроме того, подразумевается, что формальные 
правила вывода достаточно корректны, чтобы не вывести результат за пределы 
смыслового поля. Всё это, однако, при конечной системе аксиом и при достаточно 
длинном выводе не уберегает — в момент перехода от логического языка к естествен- 
ному — от появления «смысловых парадоксов». 

В логике нередко встречается мнение, что в процессе формального вывода 
сохраняется «связь по смыслу» [5], [6]. Рассмотрим пример. Возьмём две аксиомы, 
не вызывающие никаких возражений: «В огороде — бузина» и «В Киеве — дядька». 
Объединив их импликацией если — то, получим безукоризненно истинное высказы- 
вание. Однако порождённая здесь логическая истина демонстрирует как раз факт 
отсутствия смысла. Разумеется, здесь недостаёт аксиомы, связывающей объекты 
двух посылок, но мы это обнаружили уже за рамками логики («слишком поздно»). 
В данном примере недостаточность аксиом вывела нас за пределы смыслового поля. 
Проблема, однако, заключается не в том, что между истиной и смыслом нет одно- 
значного соответствия, а в том, что такого соответствия нельзя требовать. Смысл 
вообще не является компетенцией логических исчислений, и в логике это понятие 
не имеет определения. Смысл, понимаемый как совокупность неформальных связей 
между частями дискурса, не измеряется двоичной переменной. Считать смыслом имя 
предиката некорректно — это имя получает смысловую интерпретацию только в 
естественно-языковом выражении. В свою очередь, логические связки и, или, не 
также не имеют никакой другой интерпретации, кроме «математической» — это просто 
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табличные булевы функции. На пути превращения логики Аристотеля в формальную 
систему, как отмечает Д.А. Поспелов, «исчезла логика и победила математика» [7]. 

Не всё благополучно обстоит также и с аксиоматикой. Попытка придать семан- 
тику даже простому аксиоматическому утверждению обходится дорого: приходится 
уточнять понятия, затем — уточнять вторичные понятия, и этот процесс лавинообразно 
нарастает, вовлекая в себя всё новые пласты знания [6]. Именно поэтому «Логик пока не 
идёт дальше рассмотрения узкоспециализированных понятийных систем» [6]. 

Сделаем уточнение. Несмотря на «размежевание» истины и смысла, мы ни в 
коей мере не отрицаем их взаимной зависимости в ином — этическом плане. Как 
отмечают психологи, человек «выделяет особый смысл, который связан с ориента- 
цией на истину как на бытийную ценность и является нормативным по отношению 
к профессиональной деятельности учёного» [8]. 

Сформулируем кратко итог. Истинность есть мера выводимости выска- 
зываний, а смысл есть мера знания о мире. С позиций искусственного интеллекта 
можно считать, что категория смысла универсальнее истины. 

В следующем разделе рассмотрен пример логико-предикативной модели пред- 
ставления знаний, используемой для машинного диалога. Он необходим для сопо- 
ставления с онтологической моделью. 


Принципы логической обработки знаний 


Типичные черты предикатно-логического подхода присутствуют в поисковой 
системе, подробно и ясно описанной в работе [5]. Предметной областью служит 
организация производства, снабжения и сбыта в металлургической отрасли Украины 
(фрагмент отрасли). 

Информация о ПрО представлена в базе знаний в виде семантических структур 
фактов, причём данные структуры явно определяют стандартные связи между 
объектами. Фактом называют локализованную минимальную совокупность понятий 
естественного языка, отражающих связь между классами объектов, классами и их 
элементами, а также между элементами различных классов. Факты называются 
также суждениями или высказываниями. Классы объектов перечислены в базе дан- 
ных. Семантическая структура факта представлена деревом, в узлах которого находятся 
понятия, а дуги отражают семантические отношения между ними. Одновременно 
такая графическая структура транслируется в предикатную форму. 

Запрос, который формулируется на естественном языке с незначительными 
ограничениями на синтаксис, преобразуется через предикатную форму в семантическую 
структуру, подобную структурам базы знаний. После этого производится распозна- 
вание структуры запроса в базе знаний. При совпадении структура базы знаний 
преобразуется в предикат, а последний транслируется в ответ на естественном языке. 

Поисковая система поддерживает составные и сложные вопросы. Она может не 
только продублировать вопрос с выдачей искомых данных, но и представить 
прогнозы относительно ресурсов, выполнения плана и другую ценную информацию, 
не представленную в явном виде. 

Как утверждает автор рассматриваемой работы, предикат типа: «Находится 
(предприятие (А), город (В))» «связывает понятия «предприятие» и «город» в 
единое, имеющее смысл целое» [5]. С этим можно согласиться, если рассматривать 
данную ситуацию как «функциональное отношение между предикатом и актан- 
тами, которое отражает семантическую структуру данной ситуации» [3]. И при 
этом добавить, что смысл «целого» проверяется за пределами логики. 

В описанной системе логика предикатов, дополненная структурами знаний, 
служит естественным аппаратом для проверки истинности выводимых утверждений: 
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предметная область в понятийном плане ограничена, данные структурированы, 
предикатные отношения перечислимы (сведены в таблицу), синтаксис упрощён. 
Однако, как справедливо отмечает Д.А. Поспелов, «возникают огромные техниче- 
ские трудности, которые перерастают в принципиальные препятствия, как только 
модель мира становится достаточно объёмной, а число тем, по которым человек 
хочет вести диалог с ЭВМ - велико» [1]. 

В новейших работах логико-семантического направления наблюдается стрем- 
ление больше сблизить логику с семантикой. Для этого, например, в работе [9] в 
теорию вводятся «модели миров». Успех в данном направлении, по нашему мнению, 
может быть достигнут, если номинативные структуры логики будут связаны с систе- 
мой репрезентации знаний, а выводимость будет означать обнаружение формальных 
смысловых связей. Тогда семантическая нагрузка может быть возложена в моделях 
миров на интенсиональные и экстенсиональные связи, а прерогативой логики оста- 
нется вывод и синтез сложных семантических понятий из простых. 


Что мы хотим извлечь из текста? 


В конечном итоге, все методы семантического анализа направлены на форма- 
лизацию и обработку знаний. Однако при решении задач семантической обработки 
текстов вырисовывается принципиальная разница не столько в методах, сколько в 
целевой установке обработки знаний: если логический аппарат ориентирован на вы- 
вод и получение новых знаний, то семантический анализ текстов нацелен на извлечение 
готовых знаний и их перекрёстный анализ. При этом, как указывалось, истинность 
или ложность обнаруженных в тексте конкретных знаний не являются целью семан- 
тической обработки: приоритетная цель заключается в установлении смысловых 
отношений между лексическими элементами, кодирующими знание. 

В зависимости от степени формализации текста и сложности мы можем извлечь 
из него либо ту информацию, которая в нём содержится — в терминах непосредственно 
составляющих, либо другую информацию, которая раскрывает содержимое терминами 
контекстного знания. В последнем случае необходимо построить систему контекстного 
знания — онтологию. Как будет показано ниже, целью семантической обработки явля- 
ется извлечение из текста и дискурса онтологического смысла. Тем самым категория 
«смысл», извлечённая из ментальной сферы, приобретает определённость и конструк- 
тивность, что позволяет вести обработку машинными средствами. Однако, как справед- 
ливо указывает И.Б. Штерн, «рассматривая понимание естественного языка как 
оперирование смыслом, прежде всего надо разрешить принципиальные проблемы, свя- 
занные с определением сущности и структуры смысла» [3]. Один из возможных 
способов решения этих проблем предложен в следующих разделах. 

Краткие выводы. В тех текстах, где данные могут быть структурированы и 
ограничены по множеству объектов и отношений (например, в рамках ПрО), целью 
диалога или поиска служит извлечение данных. В сложных текстах требуется из- 
влечь смысл как цель коммуникации. 


Онтология и смысл 


Онтологическая картина мира 


Наша задача заключается в том, чтобы перевести понятие «смысл» из мен- 
тальной или подразумеваемой категории — в конструктивную. Это возможно 
сделать лишь в том случае, если смысл будет включён в формальную систему 
репрезентации знаний — семантическую сеть; наиболее пригодной для наших целей 
является онтология [10]. 
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Известны онтологии двух типов — абстрактные и предметные онтологии. 
Абстрактные онтологии (Дж. Совы, СУМО, Микрокосмос и др.) создаются с фило- 
софских позиций, чтобы ответить на вопрос: какие категории познания создаёт чело- 
век для понимания универсума — природы, космоса, материи. Однако на уровнях 
межличностного и социального общения человек, стремясь быть понятым, предпо- 
читает структурировать мир иначе. В этом случае для передачи коммуникативных 
знаний подходят предметные онтологии, которые лучше передают ситуации и 
события в окружающей среде. Предметная онтология способна сочетать в себе, в 
терминологии Ю.Д. Апресяна, «научную» и «наивную» картины мира. 

Предметная лексическая онтология представляет собой семантическую сеть, в 
которой узлам соответствуют языковые понятия, описывающие объекты или состоя- 
ния — концепты, а связи отображают различные отношения между ними. В соответ- 
ствии с законами познания внешнего мира сеть имеет иерерархическую архитектуру, 
где чем больше уровень общности (или объём) понятия, тем более высокое место в 
структуре оно занимает. «На стадии концептуализации эта иерархическая струк- 
тура превращается в пирамиду знаний» [4]. Формальные концепты и отношения 
сети имеют под собой мощную систему интерпретации на естественном языке. 

Для репрезентации глобальной системы всеобщих знаний, ориентированной на 
анализ текстов с произвольной тематикой, разработана предметная онтология ИО*3; 
она подробно и вместе с примерами описана в работе [11]. 


Трёхуровневая иерархическая онтология ИО*З 


Основными принципами построения трёхуровневой иерархической онтологии 
ИО*3 являются: 

— структурирование мира на основе материалистической парадигмы акаде- 
мика В.И. Вернадского; 

— введение трёх уровней иерархии («слоёв знаний»), внутри которых разви- 
ваются и структурируются многочисленные подуровни концептов; 

— выбор в качестве концептов имён, которые именуют (кодируют) понятия, 
объекты, ситуации, состояния и атрибуты в языковой среде общего знания и общения; 

—выбор в качестве концептуальных связей: формальных, атрибутивных и 
ассоциативных отношений; 

— задание интерпретирующей системы на множестве декларативных знаний, 
хранящихся в учебниках, энциклопедиях и толковых словарях; 

— замыкание концептов на словарь естественного языка. 

Верхний уровень иерархии образует дерево, вершиной которого служит гло- 
бальный концепт Материя. Далее он раскрывается через понятия: Косное вещество, 
Живое вещество; последнее разделяется на Биосферу и Ноосферу, и далее деление 
продолжается, переходя к концептам среднего уровня. Здесь находятся понятия, 
которые сложились в науке для изучения природы, человека и общества по отраслям 
знаний. Наконец, общенаучные понятия раскрываются на нижнем уровне через 
конкретные характеристики и отношения бытового уровня, которые могут быть 
спрогнозированы в корпусе текстов. Кроме того, на третьем уровне формулируются 
и подключаются к среднему уровню концепты предметных областей, которые могут, 
в принципе, представлять любые области знаний и деятельности человека. 

Построение пирамиды онтологии подчинено чёткому принципу репрезентации 
знаний через интенсионалы и экстенсионалы. Каждое понятие в семантике рассмат- 
ривается в единстве этих двух категорий. Это значит, что каждый интенсионал 
должен быть раскрыт соответствующим ему по семантическому отношению экстен- 
сионалом. Практически это означает, что каждый концепт, выступающий в роли 
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интенсионала или экстенсионала, имеет значение из множества имён объектов или 
ситуаций, которые имеют денотат в реальном мире и лексический смысл в естест- 
венном языке [12]. В онтологии ИО*3 в роли экстенсионала могут выступать: части 
понятия (при классификации), его признаки (при атрибуции), значения (при уточне- 
нии понятия), примеры (в качестве представителей класса), а также ассоциативные 
понятия (по усмотрению эксперта). Очевидно, что при движении по вертикали пира- 
миды (вниз) экстенсиональные компоненты становятся интенсиональными по отно- 
шению к собственным определителям. Экстенсионалы через свои имена (значения 
концептов) взаимодействуют со словарём естественного языка. 

Для того чтобы придать пирамиде знаний конструктивные, процедурные свой- 
ства, воспользуемся понятием «графа концептуальных зависимостей», введенным 
Р. Шенком. Уникальным свойством данной конструкции является тот факт, что «граф 
концептуальных зависимостей служит метаязыком для внутренней смысловой ре- 
презентации текстов, который отображает смысловую структуру ситуации» [3]. 

Иерархическую трёхуровневую онтологию — ИО*З будем считать ориенти- 
рованным концептуальным графом, все пути на котором ведут из любого концепта к 
глобальной вершине Материя. 

Относительно количества концептов и внутренних связей онтологии никаких 
ограничений не делается: её структура является расширяемой за счет добавления 
новых знаний, в том числе разных Про. 

Концептуальный онтологический граф ИО*3 имеет следующие преимущества, 
которые выделяют его среди других систем репрезентации знаний: 

— граф служит инструментом формализации понятия «смысл текста естествен- 
ного языка»; 

— он позволяет свести процедуру семантического анализа текста к извлечению 
смысла и реализует данную процедуру стандартными графическими операциями; 

— допускает машинное представление и машинную обработку текстовых знаний. 

Семантические процедуры извлечения из текста его глубинного содержания бу- 
дем в дальнейшем называть онтологическим анализом. Результатом онтологического 
анализа служит онтологический смысл. В следующем разделе показано, каким образом 
онтологический анализ (выделение смысла) может быть реализован алгоритмически. 


Онтологический смысл: формальное представление 


В искусственном интеллекте задача извлечения знаний из текстов конкре- 
тизуется как «понимание и выделение смысла текста» [4]. Как было показано 
выше, фундаментальной основой для выделения смысла может служить онтология. 
Однако без формального определения смысл остаётся объектом ментального рас- 
смотрения в психологии и литературоведении. Ранее отмечалось [1], что попытка 
построить лингвистическую модель «Смысл — Текст» не привела к конструктивным 
результатам, поскольку, используя формальные семантические, предикатные, син- 
таксические и морфологические структуры, она в то же время не опиралась на 
систему знаний. Поэтому нашей первой задачей было дать формальное определение 
смысла как категории мышления и сделать смысл вычислимым. 

Полное рассмотрение дано в работе [10]; здесь приводятся только основные 
определения. 

Определение 1. Конструктом смысла является пара концептов, связанных меж- 
ду собой формальным, атрибутивным или ассоциативным отношением. 

Определение 2. Онтологический смысл строится из конструктов смысла. 

Онтологическим смыслом некоторого концепта является подграф концепту- 
ального графа онтологии ИО*3, определяемый начальным и финальным концеп- 
тами. Указанный подграф называется смысловой траекторией начального концепта. 
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Определение 3. Значением начального концепта смысловой траектории служит 
ключевое слово текста; значением финального — вершина онтологии Материя. 

Определение 4. Совокупность смысловых траекторий всех ключевых слов 
текста формально определяет онтологический смысл текста. 

Смысловой анализ ЕЯ текста начинается с извлечения из него очередного 
ключевого слова. Основанием для такой операции служит определение, предложен- 
ное в работе [4]: «Набор ключевых слов — это набор опорных точек, по которым 
развёртывается текст при кодировании в память и осознаётся при декодировании, 
это семантическое ядро цельности». Со своей стороны, мы опираемся на гипотезу, 
что ключевые («значимые») слова являются основным семантическим инструментом 
автора текста для кодирования своего замысла. 

Таким образом, формальный онтологический смысл получается в результате 
проекции дискретизированного текста на онтологию ИО*3. Результатом отобра- 
жения в сети каждого ключевого слова служит смысловая траектория — дискрет- 
ная упорядоченная цепочка взаимосвязанных концептов, которая «считана» с под- 
графа онтологического графа. Задание онтологического смысла в таком формате 
пригодно для компьютерного представления и «машинного понимания». 

Онтологический смысл отличается от других известных определений, а тем 
более — от интуитивного понимания смысла, тем, что он задан в многомерной 
лексической координатной системе представления знаний о внешнем мире и имеет — 
в фиксированной онтологии — однозначное графическое представление. 


Машинное понимание текстов 


Понимание и связность 


Как отмечалось выше, многие исследователи в области искусственного интел- 
лекта определяют понимание реалии как «постижение её смысла через конститу- 
ирующие её контексты» [13]. Рассматривая понимание естественного языка как 
оперирование смыслом, прежде всего необходимо разрешить принципиальные проб- 
лемы, связанные с определением сущности и структуры смысла» [3]. 

Такие принципиальные проблемы (как было показано выше) имеются. На пути их 
разрешения нами предложено понятие «онтологического смысла»: именно благодаря 
ему сущность и структура данной гносеологической категории приобретают формаль- 
ный вид. Подчеркнём ещё раз, что онтологический смысл не есть отображение высказы- 
вания на множество ноль и единица. Это есть отображение высказывания на связное 
множество именованных концептов, репрезентующее систему знаний — онтологию. 

В самом общем случае понимание является целью коммуникации и прерога- 
тивой двух интеллектов. На ментальном уровне процесс понимания означает воз- 
буждение в памяти человека моделей реальности (языковых и образных), нахожде- 
ние аналогий или закрепление новых связей; на машинном уровне факт «компью- 
терного понимания» означает возбуждение на графе онтологии соответствующего 
подграфа смысла и связывание его с другими подграфами. В том и другом случае 
реконструируется некоторая языковая ситуация (реалия). 

Соединение онтологии со смыслом позволяет соединить семантику и праг- 
матику текста в единый процедурный комплекс. Действительно, онтология знаний 
отвечает за связь текста с внеязыковой действительностью, а смысловая траектория 
отвечает за кодирование онтологического смысла в машинной памяти. Такой синтез 
семантики и прагматики позволяет нам дать следующее определение: машинным 
пониманием текста называется процесс построения семантических траекто- 
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рий, возбуждаемых текстом на графе онтологии, которая во внутренней памя- 
ти машины выполняет роль системы репрезентации знаний о внешнем мире. 

Таким мы видим основной результат онтологического анализа ЕЯ тестов. 

Ещё один полезный результат от введения онтологического смысла состоит в 
уточнении термина связность текста. Связный текст есть функция связной мысли. 
Однако, будучи отделён от мысли, текст, особенно дискурс, имеет дискретную тема- 
тическую или сюжетную структуру. В литературоведении под связностью (например, 
повести) понимают возможность наблюдать за развитием выделенного сюжетного 
фрагмента в контексте полного сюжета, отслеживая определённую тему на фоне дру- 
гих. Связность дискурса реализуется авторскими приёмами, чаще всего — через имена 
действующих лиц, место и время действия. На уровне формальной логики связность 
текста полностью достигается переносом слова из предыдущего предложения в 
последующее, т.е. связность умозаключений является, в определённом смысле, сино- 
нимом выводимости. 

Благодаря формализации смысла в системе знаний можно ввести конструктивное 
понятие связность текста по онтологическому смыслу. Два ключевых слова в тексте 
порождают на графе две смысловые траектории, которые либо сходятся в одну точку — 
на вершине пирамиды, либо пересекаются на одном из трёх уровней онтологии ИО*3. 
Первый общий концепт этих траекторий говорит о том, что связывает два ключевых 
слова на концептуальном уровне. Именно этот общий концепт (общее понятие в языке) 
именует ту ситуацию, в которой ключи вступают в первое взаимодействие. Чем выше 
в пирамиде знаний происходит первое замыкание траекторий, чем выше уровень 
абстрагирования пары слов из текста, тем менее связным является изложение. 

Краткие выводы. На уровне графических структур мы соединили семантику с праг- 
матикой, «заставив» машину понимать смысл. «Понимание» и «смысл» соотносятся как 
синонимы. Связность текста устанавливается через пересечение траекторий смысла. 


Зачем нам нужен онтологический смысл? 


Не отрицая ментальное происхождение смысла, которое подтверждается утвержде- 
нием, что «смысловым содержанием фраза наполняется в психическом процессе» [12], 
мы можем дополнить: «смысловое содержание фразы выявляется в онтологи- 
ческом процессе машинного понимания теста». 

Какие последствия может иметь введение «онтологического смысла» для тео- 
рии и практики? 

В теоретическом плане — открыта научная методология глубинного анализа 
естественно-языковых текстов сложной семантики через синтез онтологического 
смысла. Смысл становится вычисляемой семантической функцией текста и 
дискурса. В поле знаний об искусственном интеллекте разработана цельная концеп- 
ция: «текст — знания — смысл», а в инженерии знаний сделан шаг по «превращению 
искусства в ремесло». 

В практическом плане -— извлечение из текста онтологического смысла позво- 
ляет разгрузить пользователя сети Интернет от рутинной работы по анализу потоков 
ненужной (нерелевантной запросу) информации. «Смысловой фильтр» онтологии не 
только отсеет «информационный мусор», но и представит текст в сжатом виде, 
сохранив только его смысл. Благодаря этому в системах поддержки принятия реше- 
ний руководитель или менеджер получает возможность быстро вникнуть в суть про- 
блемы — не читая сообщение полностью, а просмотрев его «смысловой портрет». 

В перспективе пользователь сможет построить собственную онтологию сферы 
его интересов и в рамках «персональной онтологии» знаний оперировать актуаль- 
ной информацией на смысловом уровне. 
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Л.О. Святогор, В.П. Гладун 

Машинне розумння текств природноу мови: онтолойчна парадигма 

Зроблено пор1вняльний анал!з двох принципово р1зних шдходв до семантично! обробки текстйв та 
дискурс в: логчна 1нтерпреташя 1 онтологчний анал!з. Залежно выд семантично! складност! тексту 
встановлюеться сфера вживання кожного напрямку. Детально розглядаеться метод онтолойчного 
аналзу, що спираеться на систему знань та формалзовану категор!ю «смисл». Уточнюеться поняття 
«машинне розуминня текств природно! мови». 


Г.А. Зушюзог, Г.Р. СЛа4ип 

Маспше Опдег%апдто оГА Мага! Гапоцаосе Техб: ап Опо]0о1са! Рагад от 

Тве сотрагайуе апа[у$1$ оЁ о еззепйаПу @1егеп{ арргоасВез {0 зетапйс ргосеззшс {ех5 ап4 415соигсез 
15 ехесшеа: |оглса| имегргаайоп ап опю]о21са| апа]уз15. Оереп@ште оп зетайис сотр/ехИу оР {ехё Фе 
зрБеге оЁ аррИсаБИИу оЁ еасВ 4песйоп 1$ езаБ$Веа. ТВе опю]оз1са| апа[уз15 тефо@ \ЫсЬ ]еап$ оп 
Кпо\Ле4дое гергезепайоп зузет ап Фе пе\у КЮюгта|2е сайесогу “Фе опюоз1са| зеп$” 15 ш де! 
сопз14еге4. ТБе сопсер{ “тасБше ипдегапа те” оРпабга] 1апгчазе {ех 15 сопзгаснуе1у деегитед. 
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